#moderación de contenido

Confiado, Calibrado o Cómplice: Alineación de Seguridad y Sesgo Ideológico en la Detección de Discurso de Odio por LLM

Explora cómo los LLMs detectan el discurso de odio: entre confianza, calibración y complicidad. Un análisis crítico sobre seguridad y sesgo en la moderación.

2026-05-06 · 1 min